草庐IT

python - 升级python而不破坏yum

全部标签

python - 带有 : in name in lxml 的标签

我正在尝试使用lxml.etree来解析Wordpress导出文档(它是XML,有点像RSS)。我只对已发布的帖子感兴趣,因此我使用以下内容循环浏览已发布的帖子:foritemindata.findall("item"):ifitem.find("wp:post_type").text!="post":continueifitem.find("wp:status").text!="publish":continuewrite_post(item)其中data是所有item标签所在的标签。item标签包含帖子、页面和草稿。我的问题是lxml找不到名称中包含:的标签(例如wp:post_t

xml - 这是什么标记语言? ...行尾而不是结束标签

我正在尝试解析一个看起来与此类似的文档:111212DefenseLogisticsAgencyDLAAcquisitionLocationsDLALandandMaritime43218-399059ProposedprocurementforNSN5365013055528SPACER,PLATE:Line0001Qty70.00UIEADeliverTo:ARIZONAINDUSTRIESFORTHEBLINDBy:0180DAYSADOThesolicitationisanRFQandwillbeavailableatthelinkprovidedinthisnotice.Ha

python - 使用命名空间获取 lxml 标签属性

我的XML看起来像:......我有代码:fromlxmlimportetree...forterm_entryinroot.iterfind('.//termEntry'):printterm_entry.attrib['id']printterm_entry.nsmapforlang_setinterm_entry.iterfind('langSet'):printlang_set.nsmapprintlang_set.attribforsome_stuffinlang_set.iterfind('some_stuff'):...我得到空的nsmap字典,我的attrib字典看起来

xml - 如何使用其 baseName 而不是 Item(#) 选择 XML 子节点?

我有点坚持以下几点:我尝试使用VBA将货币汇率从本地银行网站获取到Excel-主要用于XML解析练习,我想说这是我第一次认真的尝试。经过几个小时的谷歌搜索和阅读相关的SO问题后,我或多或少得到了可行的解决方案,但我想对其进行优化以更好地理解XML。到目前为止一切顺利,问题是:Евро978EURThu,31Jan201309:00:00GMT11550.000011820.00001Российскийрубль643RUBThu,31Jan201309:00:00GMT279.0000292.00001ДолларСША840USDThu,31Jan201309:00:00GMT85

python - 将 elementtree 转储到 xml 文件中

我用这样的东西创建了一个xml树top=Element('top')child=SubElement(top,'child')child.text='sometext'如何将其转储到XML文件中?我尝试了top.write(filename),但该方法不存在。 最佳答案 您需要实例化一个ElementTree反对并调用write()方法:importxml.etree.ElementTreeasETtop=ET.Element('top')child=ET.SubElement(top,'child')child.text='som

python - 清理 xml ==> 如果有空标签则删除行

我想清理我的xml,这样它不仅是有效的XML,而且以一种非常易于阅读的方式格式化。例如:Hello9.99我想删除所有带有空标签的行,留下:Hello9.99我尝试使用正则表达式执行此操作,但在以可读格式保留它方面运气不佳:txt=etree.tostring(self.xml_node,pretty_print=True)txt=re.sub(r'\n','',txt)完成上述任务的最佳方法是什么? 最佳答案 使用XML解析器。思路是findallemptynodes使用//*[not(node())]XPath表达式和remov

python - 解析包含默认命名空间的 xml 以使用 lxml 获取元素值

我有一个这样的xml字符串str1="""http://www.example.org/sitemap_1.xml.gz2015-07-01"""我想提取中存在的所有url节点即http://www.example.org/sitemap_1.xml.gz我试过这段代码,但没有字fromlxmlimportetreeroot=etree.fromstring(str1)urls=root.xpath("//loc/text()")printurls[]我试图检查我的根节点是否形成正确。我试过了,得到了与str1相同的字符串etree.tostring(root)'\n\nhttp://

python - 使用 Python 解析 XML 站点地图

我有这样的站点地图:http://www.site.co.uk/sitemap.xml其结构如下:http://www.site.co.uk/drag_it/dragitsitemap_static_0.xml2015-07-07http://www.site.co.uk/drag_it/dragitsitemap_alpha_0.xml2015-07-07...我想从中提取数据。首先我需要数一数有多少在xml中,然后为它们中的每一个提取和数据。有没有一种简单的方法可以在Python中执行此操作?我见过其他类似的问题,但它们都提取了例如每个xml中的元素,我需要从每个元素中单独提取数据

xml - 在 Flash 中使用 json 而不是 xml 的任何特殊优势

嗯,有吗?从我读过的所有内容来看,答案似乎是否定的,但想知道是否有人有不同意见。 最佳答案 JSON通常是一种比XML更高效的数据编码方法。如果下载时间对您的应用程序很重要,那么这很重要。另一个考虑因素是E4X查询语法是否对您的特定用途具有引人注目的优势。可能您可以通过迭代单个查询行的结果来执行您想要的操作,并且在对已解析的JSON进行交互时,等效的ActionScript代码会更长。我还会考虑此应用程序是否必须与JavaScript代码交互,例如因为Flash应用程序存在于浏览器中并且必须与页面上的其他内容进行通信。如果是这样,我

Python + 外籍人士 : Error on � entities

我写了一个小函数,它使用ElementTree和xpath来提取xml文件中某些元素的文本内容:#!/usr/bin/envpython2.5importdoctestfromxml.etreeimportElementTreefromStringIOimportStringIOdefparse_xml_etree(sin,xpath):"""TakesasinputastreamcontainingXMLandanXPathexpression.AppliestheXPathexpressiontotheXMLandreturnsageneratoryieldingthetextco